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摘要 : [目的 /意义 ] 随 着 以 BIBFRAME 为 代表 的 语义 书目 模型 不 断 完善 ， 书 目 数 据 面临 着 从 MARC 
向 语义 化 书目 的 转型 。 本 文 探索 了 基于 语义 化 书目 数据 的 联合 目录 构建 模式 。 [方法 /过 程 ] 首先 分 析 
传统 联合 目录 的 建设 模式 ， 认 为 传统 联合 目录 建构 方法 在 语义 网 环境 下 有 一 定 借鉴 意义 ; 其 次 在 分 析 
BIBFRAME 2.0 书目 信息 表示 形式 的 基础 上 ， 提 出 3 种 语义 联合 目录 构建 模式 : 集中 式 语义 联合 目录 、 分 
布 式 语义 联合 目录 和 集中 与 分 布 相 结合 的 语义 联合 目录 ; 最 后 利用 Jena Fuseki+Apache HTTP 服务 器 搭建 实 
验 平 台 ， 对 语义 联合 目录 的 互 操作 模式 进行 测试 。[ 结果 / 结论 ] 实验 结果 显示 ， 本 研究 提出 的 3 种 语义 联 
合 目 录 建 设 方法 在 实践 上 具有 可 行 性 ， 可 为 图 书 情报 部 门 的 语义 化 书目 数据 互 操作 和 跨 库 检 索 系 统 的 实现 


提供 有 益 参 考 。 
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自 1966 年 美国 国会 图 书馆 制定 机 读 目录 
规范 以 来 ， MARC 已 成 为 书目 数据 的 主流 交换 
格式 ， 同 时 也 是 当前 联合 目录 构建 的 基石 。 尽 
^ MARC 在 图 书 情报 领域 得 到 了 广泛 应 用 ， 但 
学 术 界 长 期 存在 着 对 MARC 的 批评 ， 如 工 . 
Andresen 认为 MARC 缺乏 灵活 性 ， 导 致 对 资 
源 的 附加 描述 成 为 本 地 系统 和 联机 系统 交流 的 
障碍 中，G. Alemu 等 认为 MARC 在 设计 之 初 是 
面向 文献 的 ， 这 使 得 MARC 难以 描述 非 文 献 实 
体 之 间 的 关系 U. R. Tennant 在 著名 的 MARC 
Must Die 一 文中 则 指出 MARC 的 使 用 同 于 图 书 
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馆 领 域 ， 且 MARC 数据 过 于 平面 化 ， 难 以 表达 
实体 间 的 等 级 关系 站。 

在 近 20 年 时 间 里 , 美国 国会 图 书馆 、OCLC 
等 组 织 对 MARC 进行 了 诸多 改进 ， 发 展 出 
MARC21、MARCXML 等 格式 ; 在 RDA 发 布 
后 ， 图 书馆 界 也 迅速 对 MARC21 中 的 相关 字段 
进行 了 增补 和 修改 ， 以 便 与 RDA 保持 一 致 。 然 
而 从 整体 上 看 ，MARC 以 文档 为 中 心 的 设计 思 
想 已 成 为 自身 发 展 的 禁 铅 ， 简 单 地 将 MARC F 
段 映 射 为 XML 也 并 无 法 充分 揭示 文献 所 涉及 
的 实体 与 关系 。 针 对 MARC 存在 的 缺陷 ， 图 书 


， 讲 师 ， 硕 士 ，E-mail: linzf@fjnu.edu.cn。 
本 文责 任 编辑 : 易 飞 


馆 界 开始 探索 利用 关联 数据 进行 书目 元 数据 的 
描述 ， 试 图 建立 更 加 开放 、 有 足够 伸缩 性 ， 且 
能 够 溶 人 语义 网 环境 的 文献 数据 交换 标准 。 以 
BIBFRAME (Bibliographic Framework) 为 代表 
的 语义 书目 模型 ， 正 是 图 书馆 界 在 替代 MARC 
道路 上 迈 出 的 重要 一 步 。 虽然 BIBFRAME 仍 在 
完善 过 程 中 ， 但 鉴于 国会 图 书馆 在 书目 数据 领 
域 的 影响 力 ，BIBFRAME 将 不 可 避免 地 对 未 来 
的 联合 目录 构建 形式 产生 重要 影响 。 


Q BIBFRAME 及 其 研究 概况 


BIBFRAME 即 书 目 框架 ， 是 美国 国会 图 
书馆 联合 以 语义 网 技术 见长 的 数据 服务 公司 
Zepheira 共同 研发 的 书目 数据 模型 ， 旨 在 使 
用 关联 数据 对 书目 数据 进行 描述 ， 从 而 实现 
对 MARC 的 蔡 代 。 国 会 图 书馆 于 2012 年 底 
发 布 了 BIBFRAME 草案 ， 并 于 2014 年 公布 
了 BIBFRAME 正式 版 本 。BIBFRAME 正式 发 
布 后 ， 国 会 图 书馆 根据 BIBFRAME 应 用 过 程 
中 的 反馈 ， 于 2016 年 4 月 发 布 了 经 修改 后 的 
BIBFRAME 2.0 模型 和 词汇 表 。 

在 BIBFRAME 1.0 模 型 中 ， 包括 子 类 
和 子 属性 在 内 ， 共 包含 53 个 类 及 289 个 属 
TE U, — 其 中 Work, Instance, Authority 和 
Annotation 四 个 类 为 BIBFRAME 的 核心 类 : E 
m (Work) 用 于 反映 作品 的 概念 实质 ， 实 例 
(Instance) 反 映 了 作品 的 物理 载体 表现 形式 ,一 
个 作品 可 以 有 多 个 对 应 的 实例 ， 但 一 个 实例 只 
有 一 个 对 应 的 作品 ; 规范 (Authority) 实现 了 
与 作品 和 实例 相关 的 人 物 、 组 织 、 事 件 、 主 题 
的 规范 控制 ;注释 (Annotation) 则 提供 有 关 
作品 和 实例 相关 的 描述 信息 (如 封面 、 描 述 、 评 
论 、 馆 藏 等 ) 。 

BIBFRAME 2.0 对 BIBFRAME 1.0 的 
体系 结构 进行 了 优化 。 包 括 子 类 和 子 属性 在 
内 ，BIBFRAME 2.0 共 设置 了 140 个 类 及 165 
A Jg tE". BIBFRAME 2.0 中 属性 减少 而 类 增 
加 的 主要 原因 在 于 : BIBFRAME 1.0 中 ， 对 
于 一 种 资源 的 多 种 类 型 ， 使 用 多 个 属性 来 表 
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示 ， 如 表示 不 同类 型 Identiftiers〈 标 识 符 ) 的 
mE 性 包括 bfisbn、bfissn、bflccn $5, 而 
在 BIBFRAME 2.0 中 ， 相 关 标 识 符 均 使 用 
bfidentifiedBy 属性 表示 ， 标 识 符 的 类 型 则 反映 
为 bfIsbn、bf:Issn、bf:Lecn 等 多 个 类 。 

BIBFRAME 2.0 的 另 一 重要 变化 是 将 4 个 
核心 类 简化 为 3 个 : Work、Instance fil Item. Fk 
中 Work. Instance 类 的 含义 与 1.0 版 相同 ; Item 

(馆藏 项 ) 类 代表 一 个 实例 的 馆藏 复 本 (可 以 
为 实体 馆藏 或 电子 馆藏 )》 ， 并 反映 了 诸如 馆藏 
位 置 、 条 码 号 、 索 书号 等 与 馆藏 复 本 相关 的 信 
息 ， 其 内 涵 与 BIBFRAME 1.0 中 Annotation 类 
的 Helditem 子 类 相似 。 图 1 是 采用 RDF/Turtle 
格式 进行 形式 化 表述 的 BIBFRAME 2.0 馆藏 书 
目 数据 片段 ,该 数据 包含 一 个 作品 (bf:Work)、 一 
个 作品 的 实例 (bfInstance) 和 该 实例 的 馆藏 项 
CbfItem) ， 并 分 别 定 义 了 题名 Cbftitle) 、 作 

者 (bf:contributor) ~ ISBN 号 (bfIsbn) ~ 所 
在 图 书馆 CbfheldBy) 和 条 码 号 (bf:Barcode) 等 
数据 项 。 

BIBFRAME 出 现 后 ， 部 分 国外 机 构 和 
学 者 开展 了 相关 试验 与 研究 。 稚 至 2016 年 4 
月 ， 共 有 7 个 机 构 ( 美 国 国会 图 书馆 、 不 列 
颠 图 书馆 、 德 国 国 家 图 书馆 、 普 林 斯 顿 大 学 
图 书馆 、 弄 治 .华盛顿 大 学 图 书馆 、 美 国 国家 
医学 图 书馆 、OCLC) 在 BIBFRAME 项 目 平 
台中 发 布 了 书目 测试 数据 集 钼 。 欧 洲 数字 图 书 
iÈ (Europeana) 项 目的 研究 人 员 探 索 了 欧洲 
数据 模型 (Europeana Data Model, EDM) 与 
BIBFRAME 的 映射 关系 中 。 康 奈 尔 大 学 图 书 
馆 、 哈 佛 大 学 图 书馆 和 斯 坦 福 大 学 图 书馆 的 合 
作 项 目 Linked Data for Libraries (LD4L) 则 试 
图 通过 整合 包括 BIBFRAME、VIVO、VIAF 和 
ISNI 在 内 的 关联 数据 集 ， 创 建 一 个 面向 学 术 资 
源 的 语义 信息 存储 模型 1, 

我 国 图 书馆 学 界 对 BIBFRAME 的 研 
究 始 于 2014 年 。 刘 炜 、 夏 染 娟 率先 撰文 对 
BIBFRAME 的 体系 结构 、 特 性 和 应 用 领域 进行 
了 探讨 中。 笔者 通过 对 中 文 数据 库 进 行 检索 发 
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现 ， 截 至 2016 年 4 月 ， 我国 针对 BIBFRAME 
的 学 术 论 文 共有 11 篇， 研究 主要 着 眼 于 3 个 
方面 : 一 是 BIBFRAME 的 体系 架构 和 应 用 领 
域 ， 二 是 MARC (CNMARC、MARC21) 向 
BIBFRAME 转换 路 径 ; 三 是 BIBFRAME 与 
FRBR、RDA、Shema.org 等 相关 模型 和 规则 的 


比较 研究 。 目 前 国内 有 关 BIBFRAME 的 应 用 
研究 还 较为 缺乏 ， 夏 浴 娟 等 的 《基于 书目 框架 

(BIBFRAME) 的 家 谱 本 体 设计 》 一 文 是 唯一 对 
BIBFRAME 在 具体 应 用 领域 进行 研究 的 论述 中 ,有 
关 基 于 BIBFRAME 模型 的 联合 目录 构建 模式 未 
见 有 研究 涉足 。 


(prefix bf: «http://id.loc.gov/ontologies/bibframe/». 

(prefix rdfs: «http://www.w3.0rg/2000/01/rdf -schematt». 

(prefix rdf: «http: //www.w3.0rg/1999/02/22-rdf-syntax-nsit». 
«http://library.org/resources/work/9406476» a bf:Text, bf:Work; 


bf:title [ a bf:WorkTitle; 


rdfs:label "Across the river and into the trees" ]; 
bf:contributor«http://viaf.org/viaf/97006051». 
«http://library.org/resources/instance/5866658» a bf:Instance; 
bf:instanceOf«http://library.org/resources/work/94064763»; 
bf:identifiedBy [ a bf:Isbn; rdf:value “9780743565172” ]. 
«http://library.org/resources/item/72616221» a bf:Item; 
bf:itemOf«http://library.org/resources/instance/5866658»; 


bf:heldBy«http://library.org/organization/sample-lib»; 
bf:identifiedBy [ a bf:Barcode;rdf:value “001937362” ]. 


Q 传统 联合 目录 建设 模式 分 析 


联合 目录 (union catalogs) 在 联合 检索 、 联 
机 编目 、 馆 际 互 借 等 馆 际 资源 共 建 共享 业务 中 
具有 重要 作用 。 联 合 目录 最 早 始 于 1898 FHE 
士 10 所 大 学 图 书馆 编制 的 《柏林 印刷 本 目录 》, 随 
后 在 美国 国会 图 书馆 等 机 构 的 推动 下 ， 逐 步 发 
展 出 卡片 式 联合 目录 、 缩 微 胶片 式 联合 目录 、 光 
盘 版 联合 目录 和 联机 目录 等 多 种 形式 上， 其 中 
联机 目录 是 当前 联合 目录 建设 的 主流 形式 。 从 
体系 结构 上 看 ， 传 统 联机 目录 总 体 可 分 为 两 种 
类 型 : 集中 式 联机 联合 目录 和 分 散 式 联机 联合 
目录 。 

2.4 集中 式 联 机 联合 目录 

集中 式 联机 联合 目录 的 典型 特征 为 存在 一 
个 中 央 书 目 数据 库 ， 该 数据 库 通 过 一 定 机 制 与 
成 员 馆 书目 数据 实现 同步 更 新 。 集 中 式 联 合 目 
录 实 现 的 关键 在 于 中 央 数 据 库 与 成 员 馆 的 数据 


图 1 BIBFRAME 2.0 馆藏 书目 数据 实例 


同步 机 制 。 当 前 联机 目录 的 建设 实践 主要 基于 
人 工 批量 同步 和 元 数据 收割 两 种 形式 。 如 我 国 
台湾 地 区 的 "全国 图 书 书目 资讯 网 ”CNBINet) BI 
是 前 者 的 代表 。 根 据 NBINet 的 《书目 网 络 合 
作 办 法 》，NBINet 成员 馆 须 定期 或 不 定期 向 
台湾 “国家 图 书馆 ” 寄 送 CMARK、USMARK 或 
MARK21 格式 的 档案 ,“ 国 家 图 书馆 ? 则 负责 将 
成 员 馆 的 MARC 数据 导入 NBINet 数据 库 "1。 
CALIS 联合 目录 数据 库 也 采用 了 集中 式 数 据 库 
结构 ， 在 管理 中 心 和 地 区 中 心 建立 8 个 联合 目 
录 数 据 库 ， 通 过 ' 增 量 复制 ' 和 技术 〈 互 为 镜像 ” 使 
8 个 联合 目录 数据 库 中 的 书目 记录 保持 准 同步 "1。 
基于 元 数据 收割 的 联机 目录 多 采用 OAI-PMH 
协议 。 

OALPMH 定义 了 两 类 角色 : 数据 提供 
者 (data prodiver) 和 服务 提供 者 (service 
provider) 。 数 据 提供 者 将 一 个 或 多 个 书目 数据 
仓储 以 OAI 协议 进行 发 布 ， 服 务 提供 者 则 使 用 


支持 OAI 协议 的 客户 端 对 OAI 仓储 进行 定期 收 
制 。 当 前 在 openarchives.org 中 公布 的 数据 提供 
者 已 达 3 014 个 趾 。 国 内 的 CALIS 高 校 学 位 论 
文 数据 库 和 中 国 科学 院 联 合 机 构 知 识 库 也 采用 
了 成 员 馆 分 散 建 库 、 中 心 馆 利 用 OALPMH 集中 
收割 的 建设 模式 。 
2.2 分 布 式 联机 联合 目录 

分 布 式 联机 联合 目录 由 不 同文 献 机 构 维护 
各 自 的 书目 数据 库 ， 书 目 检索 方 通过 联邦 检索 
的 形式 向 多 个 文献 机 构 广 播 检索 请 求 ， 并 将 返 
回 的 检索 结果 进行 汇总 。 当 前 主流 的 分 布 式 联 
机 目录 大 多 基于 Z39.50 协议 ， 即 检索 客户 端 将 
检索 请 求 转换 为 Z39.50 协议 的 应 用 协议 数据 单 
元 CAPDU) 后 广播 至 多 个 支持 239.50 协议 的 
服务 器 。 服 务 器 对 APDU 解码 后 ， 转 换 成 自身 
系统 的 检索 请 求 进行 查询 。 查 询 完 成 后 ， 使 用 
相同 的 方法 将 检索 结果 返回 给 检索 客户 端 。 如 
香港 科技 大 学 的 《香港 大 学 图 书馆 联合 目录 》 就 
利用 Z39.50 实现 了 包括 8 所 香港 大 学 和 16 个 国 
外 机 构 在 内 的 文献 资源 分 布 式 检索 "。 


全 联合 目录 的 语义 化 构建 


语义 网 是 工 Berners-Lee 于 1998 年 所 提出 
的 概念 ， 其 目标 是 为 万 维 网 中 的 文档 添加 可 理 
解 的 语义 ; 2006 年 ，T. Berners-Lee 在 语义 网 的 
基础 上 提出 了 关联 数据 (inked data) 一 词 ， 试 
图 利用 Web 实现 对 RDF 数据 的 相互 关联 ， 最 终 
形成 数据 之 网 (Web of Data) 。 语 义 网 和 关联 
数据 的 概念 提出 后 ， 图 书馆 界 也 在 不 断 探 索 书 
目 数 据 语 义 化 的 策略 。 目 前 图 书馆 界 的 数据 语义 
化 尝试 主要 集中 在 两 个 方面 : 一 是 词 表 和 分 类 表 
数据 的 语义 化 ， 如 美国 国会 图 书馆 已 将 《美国 国 
会 图 书馆 标题 词 表 》 (Library of Congress Subject 
Headings) 进行 语 义 化 描述 (基于 SKOS) 后 以 
关联 数据 形式 发 布 在 Web 上， 台湾 “国家 图 书 
馆 ” 也 已 完成 了 主题 词 表 的 SKOS 化 和 中 文 图 书 
分 类 法 的 语义 化 转换 ， 并 将 其 应 用 于 其 编目 系 
统 " 9;， 二 是 书目 数据 集 的 语义 化 ， 如 大 英 图 
书馆 将 英国 国家 书目 (BNB) 从 MARC21 $% 
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式 转换 为 关联 数据 的 RDF/XML 格式 ， 并 通过 
Web 提供 数据 集 的 下 载 ， 德国 柏林 自由 大 学 和 
汉诺威 大 学 的 研究 者 则 利用 D2R 服务 器 将 著名 
的 计算 机 科技 文献 书目 数据 库 DBLP 发 布 为 关 
gag Un. 

近年 来 ， 随 着 关联 数据 在 图 书 情报 领域 
应 用 的 深化 ， 部 分 机 构 已 开始 尝试 实现 联合 目 
录 的 语义 化 构建 。 最 早 将 联合 目录 以 语义 化 
形式 发 布 的 机 构 为 瑞典 国家 图 书馆 ， 该 馆 于 
2008 年 尝试 将 瑞典 联合 目录 (Swedish Union 
Catalogue). 发 布 为 关联 数据 忆 。 作 为 全 球 最 大 
联机 目录 ，OCLC 的 WorldCat 数据 库 自 2012 年 
开始 将 一 批 被 广泛 收藏 的 作品 通过 Schema.org 
词汇 表 加 以 描述 ， 并 以 关联 数据 的 形式 进行 发 
布 ， 目 前 已 发 布 书目 数据 1.97 亿 条 PL 

从 当前 语义 化 联合 目录 的 建设 实践 上 看 , E 
流 构 建 方式 为 将 机 构 原 先 拥 有 的 MARC 数据 
内 容 进 行 语义 网 转换 ， 通 过 机 构 自 身 所 编制 
的 书目 本 体 对 书目 进行 语义 化 描述 ， 最 终 以 
Turtle、RDF/XML、RDFa 等 RDF 形式 化 表示 
进行 发 布 。 这 种 语义 化 联合 目录 构建 方式 的 不 
足 之 处 是 无 法 实现 原生 的 语义 联合 目录 构建 ， 联 
合 目 录 与 成 员 馆 之 间 缺 乏 语 义 化 的 数据 互 操 
作 ， 导 致 语义 书目 数据 同步 的 滞后 性 ， 同 时 也 
缺乏 基于 以 BIBFRAME 为 代表 的 标准 化 语义 书 
目 数据 格式 的 联合 目录 构建 实践 。 因 此 ， 如 何 
构建 BIBFRAME 作为 标准 的 书目 数据 载体 并 能 
够 实现 原生 语义 化 互 操作 的 联合 目录 ， 是 书目 
数据 语义 化 过 程 中 吉 待 解决 的 问题 。 


@@ 基 于 BIBFRAME 2.0 的 语义 联 
合 目录 体系 结构 


如 前 所 述 ， 传 统 联机 目录 可 采用 集中 式 
和 分 散 式 两 种 建构 策略 。 笔 者 认为 ， 传 统 联 机 
目录 的 建构 方法 在 语义 网 环境 下 有 一 定 借鉴 意 
义 ， 但 不 可 简单 套用 。 构 建 基 于 BIBFRAME 2.0 
的 语义 联合 目录 ， 可 利用 BIBFRAME 的 开放 性 
及 跨 域 关联 特性 ， 并 借鉴 传统 联机 目录 中 OAI 
收割 机 制 及 基于 Z39.50 的 广播 式 查询 机 制 ， 采 
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rac 
用 集中 式 、 分 布 式 和 集中 与 分 布 相 结合 3 种 构 
建 模式 。 

4.1 集中 式 语 义 联 机 目录 

集中 式 语义 联合 目录 的 特征 为 存在 一 个 中 
心 语义 数据 仓储 。 如 图 2 所 示 ， 中 心 语义 数据 
仓储 中 存放 有 多 个 数据 集 ， 分 别 用 于 存储 使 用 


中 心 仓储 
B const 


ChinaXiv 合 作 期 刊 


BIBFRAME 2.0 表示 的 作品 、 实 例 和 馆藏 项 三 元 组 
以 及 各 成 员 馆 、 书 库 、 作 者 的 URI 命 名 等 规范 数据 。 
所 有 数据 集 使 用 带 有 访问 权限 控制 的 SPARQL 端 
4i (Endpoint) 将 数据 开放 给 成 员 馆 。 各 成 员 馆 亦 
分 别 维护 一 份 本 地 BIBFRAME 数据 仓储 ， 同 样 使 
用 SPARQL 端点 将 数据 开放 给 中 心 仓 储 。 


b EX 
à — oe 
B | 
i ri E 
联机 目录 馆藏 项 数据 集 airs 
| ndpoint 


图 2 集中 式 语 义 联 机 


rm 
5 
全 
o 
o. 
5 
a 


目录 结构 


集中 式 语 义 联合 目录 实现 的 关键 在 于 中 心 
仓储 数据 集 与 成 员 馆 本 地 数据 集 的 同步 机 制 。 
数据 集 同步 可 采用 两 种 形式 : 

(1) 批量 同步 。 即 中 心 系 统 轮 询 成 员 馆 的 
SPARQL 端点 ， 定 期 将 本 地 书目 仓储 的 数据 收 
割 至 中 心 仓储 。 批 量 同步 方式 是 OAI-PMH 收割 
在 语义 网 环境 下 的 替代 。 

(2) 增 量 同步 。 增 量 同 步 将 语义 联合 目 
录 构 建 与 联机 编目 相 结合 ， 其 运作 流程 为 : 成 
员 馆 获得 新 馆藏 资源 时 ， 首 先 查询 本 地 仓储 是 
和 否 有 相应 作品 、 实 例 和 馆藏 信息 ， 若 无 则 通过 
HTTPPOST 方法 将 SPARQL 请 求 发 送 至 中 心 仓 
储 的 SPARQL 端点 进行 检索 。 若 中 心 仓 储 已 存 
在 该 资源 的 相应 数据 ， 则 成 员 馆 将 其 套 录 至 本 
地 仓储 中 ; 否则， 成 员 馆 完成 相关 数据 的 原始 
编目 并 同步 存储 至 本 地 和 中 心 仓储 。 为 防止 数 
据 更 新 后 导致 的 不 一 致 ， 可 在 中 心 系统 和 本 地 
系统 间 建 立 Pingback 机 制 ， 若 中 心 仓 储 中 的 数 
据 发 生 了 修改 ， 则 各 成 员 馆 本 地 系统 将 收 到 相 
应 书目 的 更 新 通知 。 增 量 同步 的 优势 在 于 可 有 
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效 防 止 元 数据 的 重复 建设 ， 因 此 特别 适合 作品 
(Work) 和 实例 (Instance) 等 共性 较 强 的 数据 
的 同步 。 
42 分 布 式 语义 联合 目录 

分 布 式 语义 联合 目录 不 设置 中 心 语义 数 
据 仓 储 ， 而 是 将 BIBFRAME 数据 分 散 存 储 于 
不 同 机 构 中 。 各 机 构 分 别 承 担 自身 收藏 的 所 有 
书目 的 作品 、 实 例 及 馆藏 项 数据 的 建设 ， 并 将 
BIBFRAME 数据 以 SPARQL 端点 的 形式 向 外 部 
开放 。 

当 联合 目录 收 到 用 户 检 索 请 求 时 ， 可 分 别 
向 各 成 员 馆 发 送 SPARQL 查询 请 求 ， 再 将 响应 
的 结果 集 进 行 合并 ， 也 可 利用 SPARQL 的 联邦 
查询 (federated query) 机 制 ， 一 次 性 对 指定 机 
构 的 书目 进行 联邦 查询 ， 并 将 检索 结果 进行 去 
重 后 提供 给 用 户 。 图 3 为 一 段 SPARQL 查询 实 
例 ， 该 实例 通过 联邦 检索 方式 查询 了 指定 ISBN 
号 的 图 书 实例 在 两 馆 中 各 自 的 馆藏 复 本 量 。 

分 布 式 语义 联合 目录 无 需 成 员 馆 对 系统 架 
构 作 较 大 调整 ， 也 无 需 部 署 专用 的 同步 终端 软 
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件 ， 因 此 较 适 合 松散 型 图 书馆 联盟 成 员 间 的 资 
源 整合 。 其 缺点 是 不 同 成 员 间 缺乏 协调 机 制 ， 可 


SELECT ?lib (COUNT(*) as ? 
{ 
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能 存在 对 同一 作品 和 实例 数据 的 重复 建设 ， 并 
由 此 产生 数据 去 重 过 程 中 的 取舍 问题 。 


itemNum) WHERE { 


SERVICE «http://library1.org/spargl» { 


?instance bf:identifiedBy ? 


isbn. 


?isbnrdf:value “9780743565172”. 
?item bf:itemOf ?instance. 
?item bf:heldBy ?lib. } 
JUNION ( 


SERVICE «http: //library2.org/sparql» ( 


?instance bf:identified 


By ?isbn. 


?isbnrdf:value “9780743565172”. 


?item bf:itemOf ?insta 
?item bf:heldBy ?lib. j 


} 
} GROUP BY ?lib 


43 集中 与 分 布 相 结合 的 语义 联合 目录 

集中 与 分 布 相 结合 的 语义 联合 目录 综合 了 
前 两 者 的 特性 。 在 这 一 模式 下 ， 作 品 、 实 例 和 命 
名 规范 等 共性 较 强 的 数据 采用 集中 式 管理 ， 馆 藏 


作品 数据 集 


实例 数据 集 


规范 数据 集 


图 4 集中 与 分 布 相 结合 


9 3i 


为 验证 上 述 语义 联合 目录 构建 方法 的 有 效 
性 ， 笔 者 使 用 Jena Fuseki+Apache HTTP Server 
搭建 实验 平台 ， 进 行 了 相关 测试 。Fuseki 是 


nce. 


图 3 基于 联邦 查询 的 分 布 式 书目 检索 


项 等 个 性 较 强 的 数据 采用 分 布 式 管理 ( 见 图 4) 。 
其 优点 在 于 通过 作品 和 实例 数据 的 集中 管理 可 以 
减少 资源 的 重复 建设 ， 同 时 通过 分 布 式 的 采集 馆 
藏 项 数据 可 以 尽 可 能 扩大 检索 的 成 员 馆 范围 。 


A 馆 
馆藏 项 数据 集 


SPARQL 
Endpoint 
B 馆 
馆藏 项 数据 集 
SPARQL 
Endpoint 
的 语义 联合 目录 结构 


Apache 基金 会 开发 的 开源 语义 网 框架 Jena 中 
的 一 个 SPARQL 服务 器 ， 其 内 置 了 TDB 三 元 
组 存储 器 ， 同 时 提供 支持 HTTP REST 架构 的 
SPARQL 端点 (Endpoint) 服务 。 

Fuseki 服务 器 自 带 有 基于 Apache Shiro 框架 
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的 权限 控制 机 制 中， 但 经 笔者 测试 ， 其 权限 控 
制 主要 针对 三 元 组 数据 集 管理 系统 ， 并 未 覆盖 
SPARQL 端点 服务 ， 这 使 得 SPARQL 端点 暴露 
在 外 ， 存 在 一 定 的 数据 安全 隐患 。 为 解决 这 一 
问题 ， 笔 者 利用 Apache HTTP Server K JZ [5] f. 
理 机 制 构 建 了 反 向 代理 服务 器 指向 Fuseki 服务 
器 的 URL， 并 针对 该 反 向 代理 设置 了 AuthType 
Basic 权限 限制 ， 从 而 将 SPARQL 端点 覆盖 在 鉴 
权 范 围 内 。 

针对 集中 式 语 义 联 合 目 录 的 馆 际 互 操 作 问 
题 ， 笔 者 按 上 述 权限 控制 方案 在 局 域 网 中 搭建 
了 两 台 部 署 有 Fuseki+Apache HTTP Server 的 
服务 器 ， 用 于 模拟 中 心 仓储 和 本 地 仓储 ， 并 
在 中 心 仓储 服务 器 中 建立 了 名 为 center 的 数据 
Æ (Dataset) ， 在 本 地 仓储 服务 器 中 建立 了 和 名 


/* 数据 查询 */ 


J local 的 数据 集 ， 两 数据 集中 均 建 立 了 名 为 
work. instance. item 的 3 个 具名 图 (Named 
Graph) ， 用 于 分 类 保存 用 于 测试 的 BIBFRAME 
2.0 RDF 数据 。 

Jena ARQ 是 Jena 所 包含 的 SPARQL Æ 
询 引 擎 ， 提 供 了 包括 基本 SPARQL 查询 、 联 
邦 查 询 及 SPARQL 更 新 在 内 的 一 系列 API。 
笔者 利用 Jena ARQ API 实现 了 对 远 端 语义 书 
目 仓储 的 查询 和 修改 ， 进 而 可 完成 数据 批量 
下 载 、 套 录 等 一 系列 操作 。 图 5 为 书目 数据 
读 写 操作 的 关键 代码 (其 中 admin 和 pw 为 
JE 权 信 息 ，http:/192.168.1.2/centersparql 和 
http://192.168.1.2/center/update 分 别 为 经 反 向 代 
理 包装 后 的 中 心 仓储 的 查询 和 修改 SPARQL rig 
BO: 


String queryString - "select * where ( graph «http://192.168.1.2/center/work» 
( «http://lib.org/work/98767» ?p ?o. ) "; // 查询 作品 
Query query = QueryFactory.create(queryString); 


HttpAuthenticatorauth = new SimpleAuthenticator(*'admin","pw".toCharArray()); 


QueryExecutionqexec = QueryExecutionFactory.sparglService( 
*http://192.168.1.2/center/spargl", query, auth); 


ResultSet results - qexec.execSelect(); 


while (results.hasNext()) ( ... ) // 和 迭代 读 取 结果 集 


/* 数据 修改 */ 


SimpleAuthenticator(“admin”,”pw”.toCharArray()); 


String updateString = “prefix bf: <http://id.loc.gov/ontologies/bibframe/>”+ 
“insert data { graph <http://192.168.1.2/center/work>”+ 

*( «http://lib.org/work/98767» a bf:Work. } }”; // 添加 作品 数据 
UpdateRequest update - UpdateFactory.create(updateString); 


UpdateProcessRemoteupdateProcess = (UpdateProcessRemote) UpdateExecutionFactory 
.CreateRemote(update, *http://127.0.0.1:3030/1libraryB/ 


update"); 
updateProcess.setAuthenticator(auth); 
updateProcess.execute(); 


氏 5 x 


为 验证 分 布 式 语义 联合 目录 互 操作 的 可 
靠 性 ， 笔 者 使 用 Java 程序 自动 生成 了 1 000 条 
BIBFRAME 作品 测试 数据 ， 每 部 作品 数据 各 生 
成 10 条 相关 实例 ， 每 部 实例 各 生成 10 个 相关 


Jena ARQ API 的 书目 数据 读 写 


馆藏 项 ， 共 计 10 万 条 馆藏 数据 ， 并 将 上 述 数据 
分 散 存放 于 广域网 中 的 3 台 计 算 机 中 (其 中 2 
台 位 于 Chinanet, 1 台 位 于 Cernet) 。 此 后 ， 笔 
者 以 Chinanet 中 的 另 一 主机 充当 联合 目录 服务 
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器 对 上 述 3 台 计 算 机 进行 SPARQL 查询 ， 以 联 
邦 检索 方式 查询 特定 作品 的 所 有 馆藏 信息 。 实 
验 结果 显示 ，10 次 针对 不 同 作品 的 查询 均 得 到 
正确 的 查询 结果 ， 取 得 返回 结果 所 用 的 平均 耗 
时 为 1.2 秒 ， 但 实验 也 发 现 基于 SPARQL 联邦 
查询 获取 数据 存在 一 定 的 “ 木 桶 效应 ”， 即 一 旦 某 
一 节点 连接 时 延 过 长 或 断 开 连接 ， 将 导致 联合 
目录 查询 超时 。 因 此 ， 笔 者 认为 基于 联邦 检索 
方式 实现 的 分 布 式 语 义 联合 目录 主要 适用 于 网 
络 时 延 较 短 、 成 员 馆 节点 数量 较 少 的 应 用 场景 。 
在 网 络 时 延 不 确定 或 需要 大 规模 分 布 式 查询 的 
应 用 场景 中 ， 通 过 前 述 Jena ARQ API 分 别 查询 
成 员 馆 SPARQL 端点 ， 再 进行 数据 合并 的 方式 
应 更 为 理想 。 


@@ 总 结 与 展望 


基于 BIBFRAME 2.0 的 语义 联合 目录 相 比 
传统 联合 目录 相 比 ， 主 要 优势 在 于 : 

G) 实现 了 书目 信息 内 容 揭示 和 馆藏 数据 
的 分 离 。 在 BIBFRAME 模型 中 ， 作 品 数 据 属于 
抽象 内 容 ， 实 例 和 馆藏 数据 属于 载体 表现 ， 在 
描述 时 分 开 描 述 。 在 语义 联机 目录 中 ， 作 品 、 作 
品 实例 和 馆藏 项 三 元 组 可 以 分 别 存储 于 不 同 数 
据 集中 ， 由 不 同 机 构 或 部 门 负责 维护 ， 用 户 在 
联机 检索 时 再 整合 多 个 数据 集 的 内 容 进 行 查 询 。 

(2) 提高 了 书目 数据 的 开放 性 和 关联 程度 。 
在 语义 网 中 , 使 用 HTTP URI 作 为 实体 的 标识 符 。 
在 BIBFRAME 书目 数据 中 ， 任 何 与 图 书 有 关 的 
实体 (如 作者 、 出 版 商 、 图 书馆 、 地 区 ) 均 可 
使 用 URL 进行 标识 。 这 有 助 于 打破 传统 图 书馆 
的 封闭 系统 与 万 维 网 之 间 的 滥 篇 ， 便 于 实现 书 
目 数据 和 其 他 开放 数据 集 之 间 的 混搭 。 

针对 BIBFRAME 2.0 出 现 后 书目 数据 语义 
化 的 发 展 ， 本 研究 在 分 析 传 统 联合 目录 构建 机 
制 的 基础 上 提出 了 3 种 语义 联合 目录 的 构建 模 
式 ， 即 集中 式 语义 联合 目录 、 分 布 式 语义 联合 
目录 以 及 集中 与 分 布 相 结 合 的 建设 模式 ， 通 过 
语义 联合 目录 的 构建 ， 可 实现 馆 际 间 语 义 书目 
数据 的 联合 查询 ， 进 而 可 为 基于 BIBFRAME 的 
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语义 联机 编目 和 馆 际 互 借 等 馆 际 协作 提供 基础 。 

为 验证 语义 联合 目录 构建 方法 的 有 效 性 , 本 
研究 开展 了 基于 BIBFRAME 和 语义 仓储 的 馆 际 
互 操 作 实 验 。 由 实验 结果 可 知 ， 本 研究 提出 的 
语义 联合 目录 建设 方法 在 实践 中 具有 可 行 性 。 
在 本 研究 中 ， 主 要 以 自动 生成 的 书目 数据 作为 
测试 资源 ， 未 将 大 批量 MARC 数据 转换 后 进行 
测试 ， 同 时 也 缺乏 对 大 量 成 员 馆 节点 在 跨 区 域 
网 络 环境 下 构建 联合 目录 的 测试 。 在 后 续 研究 
中 ， 笔 者 将 对 CNMARC 向 BIBFRAME 2.0 的 
转换 机 制 进行 探索 ， 同 时 对 跨 区 域 多 节点 环境 
下 的 语义 联合 目录 应 用 予以 关注 和 测试 。 


参考 文献 : 


[1] ANDRESEN L. After MARC-what then[J]. Library hi 
tech, 2004, 22(1): 40-51. 
[2]  ALEMU G, Stevens B, Ross P, et al. Linked data for 


libraries: benefits of a conceptual shift from library 


specific record structures to RDF-based data models[J]. 
New library world, 2012, 113(11/12): 549-570. 
3] TENNANT R. MARC must die[J]. Library journal, 2002, 
127(17): 26-28. 
4] Library of Congress. BIBFRAME vocabulary[EB/OL ]. 
[2016-04-10]. http: //bibframe.org/vocab-list. 
5] Library of Congress. BIBFRAME 2. 0 vocabulary[EB/ 
OL]. [2016-04-15]. http: //id.loc.gov/ontologies/bibframe. 
html. 
6] Library of Congress. BIBFRAME Implementation & 
testing[EB/OL]. [2016-04-10]. http://www.loc.gov/ 
bibframe/implementation. 
7]  Zapounidou S, Sfakakis M, Papatheodorou C. Library data 
integration: towards BIBFRAME mapping to EDM[C]// 
Closs S, Studer R, Garoufallou E, et al. Metadata and 


Semantics Research. Berlin: Springer International 
Publishing, 2014: 262-273. 

8] LDAL Project team. Project description [EB/OL]. [2016- 
04-30]. https://www.ld4l.org/description. 

9] “刘炜 , ECRIB. 书目 数据 新 格式 BIBFRAME 及 其 应 用 
D]. 大 学 图 书馆 学 报 , 2014(1): 5-13. 

10] EB, 刘炜 , 张 舌 ， 等 . 基于 书目 框架 (BIBFRAME) 
的 家 谱 本 体 设计 中. 图 书馆 论坛 ,2014(11): 5-19. 

11] FHF, ERE. 欧美 国家 联合 目录 的 进展 与 我 国 虚拟 
联合 目录 的 发 展 思 路 []]. 图 书 情报 工作 , 2002, 46(10): 
84-87. 

12] NBINet. 全 国 图 书 书目 资讯 网 合作 编目 要 点 [EB/ 
OL]. [2016-04-30]. http: //nbinet.ncl.edu.tw/content. 


202310.03115v1 


chinaXiv 


ChinaXiv 合 作 期 刊 


kiom 知 iR 管 理论 二 


www.kmf.ac.cn 2016 年 第 6 期 (总 第 6 期 ) 
aspx?t-m&id-95. portal d2 page.php?button num-d2&cnt id=301. 

13] Open Archives Initiative. Registered data providers[EB/ [7] Bots .语义 网 的 主要 功能 及 其 在 数字 图 书馆 中 的 应 
OL]. [2016-04-30]. http://www.openarchives.org/Register/ H [J]. 数字 图 书馆 论坛 , 2014(3): 2-10. 

BrowseSites. [18] Martin M. Making a library catalogue part of the semantic 

14] 姚 晓 娜 , 祝 忠明 , 卢 利 农 ， 等 . 机 构 知识 库 OAI 互 操作 数 Web[EB/OL]. [2016-05-15]. http://dcpapers.dublincore. 
据 同步 策略 研究 LJ]. 现代 图 书 情报 技术 , 20143): 14-18. org/pubs/article/view/927/923. 

15] Hong Kong University of Science and Technology Library. [19] OCLC. Data strategy and linked data[EB/OL]. [2016-05- 
239. 50 union catalogs [EB/OL]. [2016-05-03]. http:// 03]. http://www.oclc.org/data.en.html. 
ustlib.ust.hk:211/z39m. [20] Apache Software Foundation. Security in Fuseki2[EB/ 

16] 台湾 “国家 图 书馆 ”. “国家 图 书馆 ”链接 资源 系统 开 OL]. [2016-05-15]. https://jena.apache.org/documentation/ 
放 使 用 [EB/OL]. [2016-10-23]. http://catweb.ncl.edu.tw/ fuseki2/fuseki-security.html. 


Semantic Union Catalogs: The Construction of Union Catalogs Based on 
BIBFRAME 2.0 


Lin Zefei 
College of Social Development, Fujian Normal University, Fuzhou 350013 

Abstract: [Purpose/significance] With the continuous improvement of bibliographic description models 
such as BIBFRAME, bibliographic data are facing the transition from MARC to the semantic bibliography. 
This paper explores the construction model of semantic union catalogs. [Method/process| The author 
analyzed the construction model of tranditional union catalogs firstly, and considered that its pattern had 
reference significance for semantic union catalogs but should not be simply copied. Then, the authors 
analyzed the bibliographic description method of BIBFRAME 2.0, and proposed three construction models 
of semantic union catalogs: the centralized semantic union catalogs, the distributed semantic union catalogs 
and the combination of these two methods. Finally, the authors built an experimental platform based on Jena 
Fuseki and Apache HTTP server, and tested the interoperated method of semantic union catalogs. [Result/ 
conclusion] The experimental results show that the three methods proposed in this paper are feasible in 
practice, and can provide useful references for the semantic bibliographic data interoperability and the cross- 
database retrieval system of the library and information department. 

Keywords: union catalogs BIBFRAME Semantic Web linked data 


